10.1.2 On-Policy(PPO, TRPO)와 Off-Policy(DDPG, TD3) 알고리즘의 장단점 비교

10.1.2 On-Policy(PPO, TRPO)와 Off-Policy(DDPG, TD3) 알고리즘의 장단점 비교